智能论文笔记

On the Effectiveness of Mode Exploration in Bayesian Model Averaging for Neural Networks

John T. Holodnak , Allan B. Wollaber

分类：机器学习 | (统计)机器学习

2021-12-07

利用深度神经网络在监督学习设置中产生校准预测概率的多种技术已经出现了利用在多个随机起点（深坐标）的循环训练或培训期间发现的集合不同解决方案的方法。但是，只有有限的工作已经调查了探索各种解决方案（后模式）探索本地区域的效用。在CIFAR-10数据集上使用三种众所周知的深层架构，我们评估了几种简单的方法，用于探索重量空间的局部区域，相对于BRICR得分，准确性和预期的校准误差。我们考虑贝叶斯推理技术（变分推理和汉密尔顿蒙特卡罗施加到Softmax输出层）以及利用Optima附近的随机梯度下降轨迹。在将单独模式添加到合奏中均匀提高性能时，我们表明，这里考虑的简单模式探索方法在没有模式探索的情况下对整体产生的简单模式勘探方法很少。

translated by 谷歌翻译

Canonical Subproblems for Robot Inverse Kinematics

Alexander J. Elias , John T. Wen

分类：机器人

2022-11-10

Inverse kinematics of many common types of robot manipulators may be decomposed into canonical subproblems. This paper presents new solution methods to six subproblems using a linear algebra approach. The first three subproblems, called the Paden-Kahan subproblems, are Subproblem 1: angle between a vector on the edge of a cone and a point, Subproblem 2: intersections between two cones, and Subproblem 3: intersections between a cone and a sphere. The other three subproblems, which have not been extensively covered in the literature, are Subproblem 4: intersections between a cone and a plane, Subproblem 5: intersections among three cones, and Subproblem 6: intersections in a system of four cones. We present algebraic solutions and geometric interpretations for each subproblem and provide computational performance comparisons. Our approach also finds the least-squares solutions for Subproblems 1-4 when the exact solution does not exist. We show that almost all 6-dof all revolute (6R) robots with known closed-form solutions may be solved using the subproblem decomposition method. For a general 6R robot, subproblem decomposition reduces finding all solutions to a search on a circle or a 2D torus. The software code is available on a publicly accessible repository.

translated by 谷歌翻译

SPICE, A Dataset of Drug-like Molecules and Peptides for Training Machine Learning Potentials

Peter Eastman , Pavan Kumar Behara , David L. Dotson , Raimondas Galvelis , John E. Herr , Josh T. Horton , Yuezhi Mao , John D. Chodera , Benjamin P. Pritchard , Yuanqing Wang

分类：机器学习

2022-09-21

机器学习潜力是分子模拟的重要工具，但是由于缺乏高质量数据集来训练它们的发展，它们的开发阻碍了它们。我们描述了Spice数据集，这是一种新的量子化学数据集，用于训练与模拟与蛋白质相互作用的药物样的小分子相关的潜在。它包含超过110万个小分子，二聚体，二肽和溶剂化氨基酸的构象。它包括15个元素，带电和未充电的分子以及广泛的共价和非共价相互作用。它提供了在{\ omega} b97m-d3（bj）/def2-tzVPPD理论水平以及其他有用的数量（例如多极矩和键阶）上计算出的力和能量。我们在其上训练一组机器学习潜力，并证明它们可以在化学空间的广泛区域中实现化学精度。它可以作为创建可转移的，准备使用潜在功能用于分子模拟的宝贵资源。

translated by 谷歌翻译

Asymmetry Disentanglement Network for Interpretable Acute Ischemic Stroke Infarct Segmentation in Non-Contrast CT Scans

Haomiao Ni , Yuan Xue , Kelvin Wong , John Volpi , Stephen T. C. Wong , James Z. Wang , Xiaolei Huang

分类：计算机视觉

2022-06-30

非对比度CT（NCCT）图像中准确的梗塞分割是迈向计算机辅助急性缺血性中风（AIS）评估的关键步骤。在临床实践中，脑半球的双侧对称比较通常用于定位病理异常。最近的研究探索了不对称的协助AIS分割。但是，在评估其对AIS的贡献时，大多数以前基于对称性的工作都混合了不同类型的不对称性。在本文中，我们提出了一个新型的不对称分解网络（ADN），以自动将NCCT中的病理不对称性和内在的解剖不对称分离，以进行更有效和可解释的AIS分割。 ADN首先基于输入NCCT进行不对称分解，该输入nccts产生不同类型的3D不对称图。然后生成合成的，固有的 - 敏化补偿和病理 - 空气 - 对称盐的NCCT体积，后来用作分割网络的输入。 ADN的培训结合了领域知识，并采用了组织型意识到的正则化损失函数，以鼓励临床上敏感的病理不对称提取。加上无监督的3D转换网络，ADN在公共NCCT数据集上实现了最新的AIS分割性能。除了出色的表现外，我们认为学到的临床可解剖的不对称图也可以为更好地理解AIS评估提供见解。我们的代码可从https://github.com/nihaomiao/miccai22_adn获得。

translated by 谷歌翻译

Image-based Stability Quantification

Jesse Scott , John Challis , Robert T. Collins , Yanxi Liu

分类：计算机视觉

2022-06-23

使用脚压力/力量测量硬件和运动捕获（MOCAP）技术对人类稳定的定量评估昂贵，耗时，并且仅限于实验室（基于实验室）。我们提出了一种基于图像的新方法来估计稳定计算的三个关键组件：质量中心（COM），支持基础（BOS）和压力中心（COP）。此外，我们通过使用公共可用的多模式（MOCAP，脚压力，2视频视频），定量验证基于图像的方法来计算两种经典稳定度量，以直接从基于实验室的感觉输出（地面真相）产生的方法来计算两种经典稳定性措施。十个受试者人类运动数据集。我们的实验结果表明：1）我们的COM估计方法（COMNET）始终优于最先进的基于惯性传感器的COM估计技术； 2）我们基于图像的方法与单独的鞋垫脚压结合，与地面真相稳定性度量产生一致且具有统计学意义的相关性（comtocop r = 0.79 p <0.001，comtobos r = 0.75 p <0.001）; 3）我们完全基于图像的稳定性度量估计在两个稳定性指标上产生一致，正且具有统计学意义的相关性（ComtoCop r = 0.31 P <0.001，comtobos r = 0.22 P <0.001）。我们的研究为自然环境中的稳定性计算和监测提供了有希望的定量证据。

translated by 谷歌翻译

Quantitative Imaging Principles Improves Medical Image Learning

Lambert T. Leong , Michael C. Wong , Yannik Glaser , Thomas Wolfgruber , Steven B. Heymsfield , Peter Sadwoski , John A. Shepherd

分类：计算机视觉

2022-06-14

自然图像和医学图像之间的根本差异最近有利于对医学图像应用中的Imagenet转移学习使用自我监督学习（SSL）。图像类型之间的差异主要是由于成像方式和医学图像利用了广泛的基于物理的技术，而自然图像仅使用可见光捕获。尽管许多人证明了医学图像上的SSL导致了更好的下游任务绩效，但我们的工作表明可以获得更多的性能。在构建学习问题时，经常不考虑用于获取医学图像的科学原理。因此，我们建议在生成SSL期间合并定量成像原理，以提高图像质量和定量生物学准确性。我们表明，这种培训模式可为有限数据的下游监督培训提供更好的起始状态。我们的模型还生成了验证临床定量分析软件的图像。

translated by 谷歌翻译

A Methodological Framework for the Comparative Evaluation of Multiple Imputation Methods: Multiple Imputation of Race, Ethnicity and Body Mass Index in the U.S. National COVID Cohort Collaborative

Elena Casiraghi , Rachel Wong , Margaret Hall , Ben Coleman , Marco Notaro , Michael D. Evans , Jena S. Tronieri , Hannah Blau , Bryan Laraway , Tiffany J. Callahan

分类：人工智能

2022-06-13

尽管电子健康记录是生物医学研究的丰富数据来源，但这些系统并未在医疗环境中统一地实施，并且由于医疗保健碎片化和孤立的电子健康记录之间缺乏互操作性，可能缺少大量数据。考虑到缺少数据的案例的删除可能会在随后的分析中引起严重的偏见，因此，一些作者更喜欢采用多重插补策略来恢复缺失的信息。不幸的是，尽管几项文献作品已经通过使用现在可以自由研究的任何不同的多个归档算法记录了有希望的结果，但尚无共识，MI算法效果最好。除了选择MI策略之外，归纳算法及其应用程序设置的选择也至关重要且具有挑战性。在本文中，受鲁宾和范布伦的开创性作品的启发，我们提出了一个方法学框架，可以应用于评估和比较多种多个插补技术，旨在选择用于计算临床研究工作中最有效的推断。我们的框架已被应用于验证和扩展较大的队列，这是我们在先前的文献研究中提出的结果，我们在其中评估了关键患者的描述符和Covid-19的影响在2型糖尿病患者中的影响，其数据为2型糖尿病，其数据为2型糖尿病由国家共同队列合作飞地提供。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Statistical and Topological Summaries Aid Disease Detection for Segmented Retinal Vascular Images

John T. Nardini , Charles W. J. Pugh , Helen M. Byrne

分类：计算机视觉

2022-02-20

疾病并发症会改变血管网络形态并破坏组织功能。例如，糖尿病性视网膜病是1型和2型糖尿病的并发症，可能引起失明。通过视觉检查视网膜图像来评估微血管疾病，但是当疾病表现出沉默的症状或患者无法参加面对面的会议时，这可能是具有挑战性的。我们检查了在对分段视网膜血管图像的统计和拓扑摘要进行培训时，在检测微血管疾病中的机器学习算法的性能。我们将方法应用于三个公共可用数据集，并发现，在我们考虑的13个总数描述符向量中，要么是统计框计数描述符向量，要么是拓扑洪水描述符矢量可在这些数据集中达到最高准确度。然后，我们通过合并几个数据集创建了第四个数据集：盒子计数向量优于该数据集上的所有描述符，包括对组合数据集中注释样式的差异敏感的拓扑洪水向量。我们的工作是确定哪种计算方法最适合识别微血管疾病以及其当前局限性的第一步。从长远来看，这些方法可以纳入自动化疾病评估工具中。

translated by 谷歌翻译

NeuraHealth: An Automated Screening Pipeline to Detect Undiagnosed Cognitive Impairment in Electronic Health Records with Deep Learning and Natural Language Processing

Tanish Tyagi , Colin G. Magdamo , Ayush Noori , Zhaozhi Li , Xiao Liu , Mayuresh Deodhar , Zhuoqiao Hong , Wendong Ge , Elissa M. Ye , Yi-han Sheu

分类：自然语言处理

2022-01-12

与痴呆症相关的认知障碍（CI）在全球范围内影响超过5500万人，并且每3秒钟以一个新病例的速度迅速增长。随着临床试验反复出现的失败，早期诊断至关重要，但是在低水平和中等收入国家中，全球75％的痴呆症病例未被诊断为90％。众所周知，当前的诊断方法是复杂的，涉及对医学笔记，大量认知测试，昂贵的脑部扫描或脊柱液体测试的手动审查。与CI相关的信息经常在电子健康记录（EHR）中找到，并且可以为早期诊断提供重要线索，但是专家的手动审查是繁琐的，并且容易发生。该项目开发了一种新型的最新自动筛选管道，用于可扩展和高速发现EHR中的CI。为了了解EHR中复杂语言结构的语言环境，构建了一个8,656个序列的数据库，以训练基于注意力的深度学习自然语言处理模型以对序列进行分类。使用序列级别分类器开发了基于逻辑回归的患者级别预测模型。深度学习系统的精度达到了93％，AUC = 0.98，以识别其EHR中没有较早诊断，与痴呆有关的诊断代码或与痴呆有关的药物的患者。否则，这些患者将未被发现或检测到太晚。 EHR筛选管道已部署在Neurahealthnlp中，这是一种用于自动化和实时CI筛选的Web应用程序，只需将EHR上传到浏览器中即可。 Neurahealthnlp更便宜，更快，更容易获得，并且胜过当前的临床方法，包括基于文本的分析和机器学习方法。它使得早期诊断可在稀缺的医疗服务中可行，但可访问的互联网或蜂窝服务。

translated by 谷歌翻译